Code-switching input for machine translation: a case study of Vietnamese–English data

نویسندگان

چکیده

Multilingualism presents both a challenge and an opportunity for Natural Language Processing, with code-switching representing particularly interesting problem computational models trained on monolingual datasets. In this paper, we explore how code-switched data affects the task of Machine Translation, which only recently has started to tackle multilingual data. We test three Translation systems from Canberra Vietnamese–English Codeswitching Speech Corpus (CanVEC) evaluate translation output using automatic human metrics. find that, perhaps counter-intuitively, performs better input than input. particular, comparison evaluation suggests that codeswitching may boost semantic faithfulness output, effect term lexico-semantic enrichment. also report two cases where is most least clear in Vietnamese–English, namely gender-neutral 3SG pronouns interrogative constructions respectively. Overall, suggest Processing more generally, ought view multilingualism as rather obstacle.Abbreviations: 1: First person; 2: Second 3: Third CLF: Classifier; COP: Copula; DET: Determiner; PL: Plural; POSS: Possessive marker; PRT: Particle; PST: Past tense; Q: Question SG: Singular

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

a study on insurer solvency by panel data model: the case of iranian insurance market

the aim of this thesis is an approach for assessing insurer’s solvency for iranian insurance companies. we use of economic data with both time series and cross-sectional variation, thus by using the panel data model will survey the insurer solvency.

a study of translation of english litrary terms into persian

چکیده هدف از پژوهش حاضر بررسی ترجمه ی واژه های تخصصی حوزه ی ادبیات به منظور کاوش در زمینه ی ترجمه پذیری آنها و نیز راهکار های به کار رفته توسط سه مترجم فارسی زبان :سیامک بابایی(1386)، سیما داد(1378)،و سعید سبزیان(1384) است. هدف دیگر این مطالعه تحقیق در مورد روش های واژه سازی به کار رفته در ارائه معادل های فارسی واژه های ادبی می باشد. در راستای این اهداف،چارچوب نظری این پژوهش راهکارهای ترجمه ار...

15 صفحه اول

the relation between bilingualism and translation: a case study of turkish bilingual and persian monolingual translation students

translation studies have become an accepted academic subject and books, journals and doctoral dissertations appear faster than one can read them all (bassnet and lefevere, 1990). but this field also brought with itself so many other issues which needed to be investigated more, in the heart of which, issues like ideology, ethics, culture, bilingualism and multilingualism. it is reported that ove...

the trace of translators ideology in literary translations: a case study of persian translation of the scaret letter

رساله ی حاضر تلاشی است برای بررسی مبحث ایدئولوژی در ترجمه ادبی و تاثیرات آن بر کار مترجم، اعم از گزینش واژگان و ساختارهای دستوری؛ با تمرکز بر تحلیل انتقادی گفتمان در متن مبدأ و متن مقصد، که در این رساله متن مبدأ رمان داغ ننگ اثر ناتانیل هاوثورن و ترجمه فارسی سیمین دانشور به عنوان متن مقصد مورد بررسی قرار گرفته است. تجزیه و تحلیل رمان های مورد نظر به طور عمده بر اساس مدل پیشنهادی فرحزاد(2007) بر...

metrics for the detection of changed buildings in 3d old vector maps using als data (case study: isfahan city)

هدف از این تحقیق، ارزیابی و بهبود متریک های موجود جهت تایید صحت نقشه های قدیمی سه بعدی برداری با استفاده از ابر نقطه حاصل از لیزر اسکن جدید شهر اصفهان می باشد . بنابراین ابر نقطه حاصل از لیزر اسکنر با چگالی حدودا سه نقطه در هر متر مربع جهت شناسایی عوارض تغییر کرده در نقشه های قدیمی سه بعدی استفاده شده است. تمرکز ما در این تحقیق بر روی ساختمان به عنوان یکی از اصلی ترین عارضه های شهری می باشد. من...

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: International Journal of Multilingualism

سال: 2023

ISSN: ['1479-0718', '1747-7530']

DOI: https://doi.org/10.1080/14790718.2023.2224013